1. Clasifique las siguientes series (discreta o continua, univariada o multivariada)
a. Índice diario de bolsa de valores durante el período de enero 1990 a diciembre 2010. R/ Continua Univariada
b. Registro de la marea en un lugar específico durante 30 días. R/ Continua Univariada
c. Presión sanguínea de una mujer durante el embarazo. R/ Continua Univariada
d. Temperatura promedio diario durante el año 2019.R/ Discreta Univariada
e. Registro diario de nacimiento y defunciones durante el año 2010. R/ Discreta Multivariada
3. En la base de datos “nacimiento1990_1995.xls” se tienen las cifras de los nacimientos mensuales inscritos en Costa Rica de enero de 1990 a diciembre de 1995.
a. Importe los datos a R.
naci <- read_excel("Datos/nacimiento1990_1995.xls",
col_names = c("Fecha","Nacimientos"))
nacits<-ts(naci$Nacimientos,frequency = 12,start=c(1990,1))
b. Elabore un gráfico de la serie. y c. Comente sobre las características de la serie.
p<-autoplot(nacits) +
labs(x ="t", y = "Nacimientos", title="Gráfico 1. Número de nacimientos,ene-90 a dic-1995, Costa Rica")+
theme_classic()
ggplotly(p)
El gráfico 1 muestra la serie de número de nacimientos en Costa Rica registrados desde enero 1990 a diciembre 1995. Se observa una variación estacional,donde, los febreros de cada año se presenta una caída en los nacimientos, mientras que para los meses de agosto a octubre hay un crecimiento, alcanzando el valor máximo en octubre de cada año. (ver gráfico 2)
p3<-ggseasonplot(nacits, year.labels=FALSE, continuous=TRUE)+
theme_bw()+
ggtitle("Gráfico 2. Variación estacional del número de nacimientos,ene-90 a dic-1995, Costa Rica")
ggplotly(p3)
Por último, se descomponen la serie por los tipos de variaciones (tendencia-ciclo, estacional y irregular), tal y como se muestra en el gráfico 3. Se observa que la serie desde 1990 a junio 1993 presenta una tendencia decreciente y a partir de este mismo punto la serie tiende a crecer hasta finales 1994.
decomposeNacitsAditi <- decompose(nacits,"additive")
p2<-autoplot(decomposeNacitsAditi)+
theme_bw()+
ggtitle("Gráfico 3. Descomposición de la serie número de nacimientos,ene-90 a dic-1995, Costa Rica")
ggplotly(p2)
4. Considere el proceso estocástico \(Z_{t}=a_{t}\) con \(t = ±1, ±2\), … y
\[ a_{t}=\left\{\begin{matrix} 1 & Prob=0.5\\ -1 & Prob=0.5 \end{matrix}\right.\]
\[ E(Z_{t})=E(Z_{t})=1\cdot0.5+-1\cdot0.5=0 \]
Caso cuando \(s \neq t\)
\[ Cov\left ( a_{t},a_{s} \right )= E[(a_{t}-\mu_{t}),(a_{s}-\mu_{s})]\] \[= E[a_{t}\cdot a_{s}] = E[a_{t}] \cdot E[a_{s}]=0\] Caso cuando \(s = t\)
\[ Cov\left ( a_{t},a_{s} \right )= Var[a_{t}]=E[a_{t}^{2}]\] \[=1^2*0.5+(-1)^0.5=1\] entonces
\[ \gamma \left ( t,s \right )=\left\{\begin{matrix} 1 & s=t\\ 0 & s \neq t \end{matrix}\right.\]
\[\rho\left ( t,s \right )= \frac{\gamma\left ( t,s \right )}{\sqrt{\gamma\left ( t,t \right ),\gamma\left ( s,s \right )}}\] Caso cuando \(s \neq t\)
\[= \frac{0}{\sqrt{1 \cdot 1}}=0\]
Caso cuando \(s = t\)
\[\rho\left ( t,t \right )= \frac{\gamma\left ( t,t \right )}{\sqrt{\gamma\left ( t,t \right ) \cdot \gamma\left ( t,t \right )}}=\] \[\rho\left ( t,t \right )= \frac{1}{\sqrt{1 \cdot 1}}=1\] entonces
\[ \rho \left ( t,s \right )=\left\{\begin{matrix} 1 & s=t\\ 0 & s \neq t \end{matrix}\right.\]
Se concluye que \(Z_{t}\) es debilmente estacionario ya que la media es constante y \(\rho \left ( t,s \right )\) no depende de t
6.Si \(\left \{X_{t}, t \in T \right \}\) y \(\left \{Y_{t}, t \in T \right \}\)son estacionarios y además independientes, defina \(Z_{t} = a \cdot X_{t} + b \cdot Y_{t}\) para todo t. ¿\(\left \{Z_{t}, t \in T\right \}\) será estacionario?
Para verificar que \(Z_{t}\) es estacionario se deben cumplir dos condiciones que la media sea constante, en otras palabras no dependa del tiempo; y que su covarianza depende únicamente de la diferencia \(|t-s|=|h|\)
Mostrar que la media es constante:
\[E(Z_{t})=E(a \cdot X_{t} + b \cdot Y_{t})=a \cdot E(X_{t}) + b \cdot E(Y_{t})=\] \[a \cdot \mu_{X}+b \cdot \mu_{Y}\]
Por lo tanto, la media es constante pues no depende de t.
Mostrar que la covarianza depende únicamente de la diferencia \(|t-s|=|h|\):
\[Cov(Z_{t},Z_{s})=Cov[(a \cdot X_{t} + b \cdot Y_{t}),(a \cdot X_{s} + b \cdot Y_{s})]\]
\[Cov[(a \cdot X_{t} + b \cdot Y_{t}),(a \cdot X_{t} + b \cdot Y_{t})]=Var(a \cdot X_{t} + b \cdot Y_{t})\] \[a^{2} \cdot Var(X_{t}) + b^{2} \cdot Var(Y_{t})=a^{2} \cdot \sigma_{X}^2 + b^{2} \cdot \sigma_{Y}^2 \]
\[Cov[(a \cdot X_{t} + b \cdot Y_{t}),(a \cdot X_{s} + b \cdot Y_{s})]=\] Las covarianzas \(Cov(X,Y)\)son cero ya que las X_{t} y las Y_{t} son independientes, adicionalmente al ser X y Y estacionarios se sabe que \(Cov( X_{t}\cdot X_{s})=\gamma_{x}\) y \(Cov( Y_{t}\cdot Y_{s})=\gamma_{Y}\), pot lo tanto:
\[ = Cov( X_{t}\cdot X_{s})+ b^2 \cdot Cov( Y_{t}\cdot Y_{s})= a^2 \cdot \gamma_{x}(h) + b^2 \cdot \gamma_{y}(h) \]
Por lo tanto,
\[ \gamma \left ( t,s \right )=\left\{\begin{matrix} a^{2} \cdot \sigma_{X}^2 + b^{2} \cdot \sigma_{Y}^2 & s= t\\ a^2 \cdot \gamma_{x} + b^2 \cdot \gamma_{y}& s \neq t \end{matrix}\right.\]
La covarianza depende únicamente de la diferencia \(|t-s|=|h|\)
Como se observa anteriormente, se puede concluir que \(Z_{t}\) es estacionario pues cumple las condiciones que la media sea constante, en otras palabras no dependa del tiempo; y que su covarianza depende únicamente de la diferencia \(|t-s|=|h|\)
7. Considere una secuencia aleatorias \(\left \{\epsilon_{t}, t \geq 1 \right \}\) tal que \(\epsilon_{t}\) es independiente e idénticamente distribuida con media \(\mu_{\epsilon}\) y variancia \(\sigma_{\epsilon}^{2}\) . Defina el paseo aleatorio \(X_{t}\) como
\[X_{t}=\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}\]
Media de \(X_{t}\) \[ E(X_{t})=E(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t})\] \[ = E(\epsilon_{1})+E(\epsilon_{2})+...+E(\epsilon_{t})\]
\[ = \mu_{\epsilon}+\mu_{\epsilon}+...+\mu_{\epsilon}= t \cdot \mu_{\epsilon}\]
Varianza de \(X_{t}\)
\[ Var(X_{t})=Var(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t})\] \[ = Var(\epsilon_{1})+Var(\epsilon_{2})+...+Var(\epsilon_{t})\] \[ = \sigma_{\epsilon}^{2}+\sigma_{\epsilon}^{2}+...+\sigma_{\epsilon}^{2}= t \cdot \sigma_{\epsilon}^{2}\]
\[\gamma_{x}(t,s)=cov(x_{t},x_{s})\] Para el caso donde \(s=t\):
\[\gamma_{x}(t,t)=cov(x_{t},x_{t})=Var(x_{t},x_{t})=t \cdot \sigma_{\epsilon}^{2}\]
Para el caso donde \(s=t+h\):
\[\gamma_{x}(t,t+h)=cov(x_{t},x_{t+h})\]
\[Cov[(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}),(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}+\epsilon_{t+h})]=\] \[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{1},\epsilon_{2})+...+Cov(\epsilon_{1},\epsilon_{t})+Cov(\epsilon_{1},\epsilon_{t+h})+ \] \[Cov(\epsilon_{2},\epsilon_{2})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{2},\epsilon_{t})+Cov(\epsilon_{2},\epsilon_{t+h})+\] \[...+Cov(\epsilon_{t},\epsilon_{1})+Cov(\epsilon_{t},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t})+Cov(\epsilon_{t},\epsilon_{t+h}) \]
Dado que \(\epsilon_{t}\) es independiente las covarianzas donde los periodos son diferentes tienen \(Cov(\epsilon_{i},\epsilon_{j})=0\) para \(i \neq j\)
\[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t}) \]
\[=Var(\epsilon_{1},\epsilon_{1})+Var(\epsilon_{2},\epsilon_{2})+...+Var(\epsilon_{t},\epsilon_{t})=t \cdot \sigma_{\epsilon}^{2} \] Caso donde s=t-h
\[\gamma_{x}(t,t-h)=cov(x_{t},x_{t-h})\] \[Cov[(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t-h}+\epsilon_{t}),(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}+\epsilon_{t-h})]=\] \[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{1},\epsilon_{2})+...+Cov(\epsilon_{1},\epsilon_{t})+Cov(\epsilon_{1},\epsilon_{t-h})+ \]
\[Cov(\epsilon_{2},\epsilon_{2})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{2},\epsilon_{t-h})+\] \[...+Cov(\epsilon_{t-h},\epsilon_{1})+Cov(\epsilon_{t-h},\epsilon_{2})+...+Cov(\epsilon_{t-h},\epsilon_{t-h}) \]
\[...+Cov(\epsilon_{t},\epsilon_{1})+Cov(\epsilon_{t},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t-h}) \]
Dado que \(\epsilon_{t}\) es independiente las covarianzas donde los periodos son diferentes tienen \(Cov(\epsilon_{i},\epsilon_{j})=0\) para \(i \neq j\)
\[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{t-h},\epsilon_{t-h}) \]
\[=Var(\epsilon_{1},\epsilon_{1})+Var(\epsilon_{2},\epsilon_{2})+...+Var(\epsilon_{t-h},\epsilon_{t-h})= (t-h) \cdot \sigma_{\epsilon}^{2} \]
entonces
\[ \gamma \left ( t,s \right )=\left\{\begin{matrix} t \cdot \sigma_{\epsilon}^{2} & s\geq t\\ (s) \cdot \sigma_{\epsilon}^{2} & s < t \end{matrix}\right.\]
\[\gamma \left ( t,s \right )=\sigma_{\epsilon}^{2}\cdot min(t,s)\]
Se concluye que \(X_{t}\) NO es estacionario debido a que la media no es constante y \(\gamma \left ( t,s \right )\) depende de t
#Tamaño
T <- 100
## Ruido blanco= Normal con media 0 y varianza 1
epsilon <- rnorm(T,0,1)
plot.ts(epsilon, col="royalblue2")
#Caminata aleatoria
X <- cumsum (epsilon)
plot.ts(X, col="red4")
xx<-1:100
lo <- loess(X~xx)
lines(predict(lo), col='red', lwd=2)
abline(h=mean(X), col='blue')
Como se observa en el gráfico anterior, la variable \(X\) no oscila de manera alrededor de la media (linea azul), ya que depende de t (tiempo)
9. Utilice la serie fpp2::goog de la bolsa de valores del Google entre 25 de febrero, 2013 a 13 de febrero, 2017.
accgoogle<-fpp2::goog
str(accgoogle)
## Time-Series [1:1000] from 1 to 1000: 393 393 397 398 400 ...
head(accgoogle)
## Time Series:
## Start = 1
## End = 6
## Frequency = 1
## [1] 392.8300 392.5121 397.3059 398.0113 400.4902 408.0957
pgoogle<-autoplot(accgoogle)+
theme_bw()
ggplotly(pgoogle)
Se observa que en los primeros 260 periodos muestra una tendencia crecientes, sin embargo, en el periodo 160 se presenta un positivo en el nivel de la serie.
Por otro lado, a partir del periodo 260 a 599, la precio de las acciones de google se mantiene constante oscilando alrededor 550 dolares americanos.
Por último, del periodo 600 hacia delante se presenta una tendencia creciente del precio de las acciones de google.
\(Z_{t} = Y_{t} −Y_{t−1}\)
Zt mide el cambio que produce la observación en el tiempo t con respecto a la observación en el tiempo t − 1. Utilice la función diff(goog) para obtener los cambios diarios de la serie.
zt<-diff(accgoogle)
La serie si parece ruido blanco, pues varía alrededor de la media que es 0 y mantiene su variación a lo largo del tiempo
pzt<-autoplot(zt)+
theme_bw()
ggplotly(pzt)
hist(zt)
pzt2<- ggAcf(zt)+
theme_bw()
ggplotly(pzt2)
wt<-ts(rnorm(999))
pwt<-autoplot(wt)+
theme_bw()
ggplotly(pwt)
pwt2<- ggAcf(wt)+
theme_bw()
ggplotly(pwt2)